2003. 11.


『디지털 성남 문화 대전 편찬 세부 방침』 검토 의견서


김   현

한국과학기술정보연구원 정보시스템부장

과학기술연합대학원대학교 교수


  『디지털 성남 문화 대전 편찬 세부 방침』은 한국정신문화연구원의 『민족문화백과사전』 등 유사 자원에 대한 선행 편찬 사업의 경험을 토대로 상세하고 체계적으로 작성되었으므로 분류체계나 항목선정원칙, 원고작성원칙 등 제반 내용에 대해서는 별도의 의견을 드릴 필요가 없다고 판단됩니다.

  단, 이번 간행 사업은 책자형 도서의 간행을 목표로 하는 것이 아니며, 편찬된 콘텐트가 정보 시스템을 통해 서비스되도록 계획되어 있고, 편찬 작업 역시 1회에 종료되는 것이 아니라 디지털 환경에서 지속적으로 보완될 수 있도록 해야 하기 때문에 동 지침이 전문적인 “디지털 정보 자원 편찬” 지침이 되기 위해 고려해야 할 사항 몇 가지를 제안하고자 합니다.



  1. 원고 작성 단계에서의 정보 자료 구조화를 위한 고려 사항


  이번 편찬 사업은 정신문화연구원에서 추진 중인 “향토문화전자대전” 간행 사업의 선행 사업으로서, 이 사업을 통해 얻게 될 여러 가지 경험이 대규모 후속 사업의 기획에 크게 보탬이 될 수 있을 것입니다.  현재의 디지털 편찬 사업이 종래의 정보화 사업과 가장 크게 달라진 점은 “콘텐트의 저작” 행위가 디지털 환경에서 이루진다고 하는 점, 또는 산출된 저작물 그 자체가 바로 “디지털 정보”로 생산된 것이라는 점입니다.

  물론 본 편찬 사업에 참여할 인력들이 모두 정보 기술에 관한 전문 지식을 가지고 있는 것이 아니기 때문에 작성된 원고를 정문연의 편수 인력 및 정보 전문가들이 다시 가공하는 과정은 반드시 거쳐야 하겠지만, 이 경우에도 초기 생산 자원이 전산가독형(machine readable) 자원(워드 프로세서 파일 등)으로 만들어질 것이라고 생각합니다.

  따라서 집필자가 작성한 자료가 별도의 전산화 작업을 거치지 않거나, 그 작업 규모를 최소한 상태에서 정보 시스템 상에 적재되어 정보 서비스와 추가적인 편찬 작업에 활용될 수 있도록 하는 방안이 “디지털 정보 자원 편찬” 차원에서 심도있게 모색되어질 필요가 있습니다. 

  가장 바람직한 방법은 이번 편찬 사업을 위한 “디지털 정보 자원 편찬 시스템”이 먼저 개발되고, 편찬자들이 그 시스템의 사용법에 대한 교육을 받은 후에 집필 업무에 들어가는 것이 되겠으나, 그러한 준비가 안 된 상황에서는 다음과 같은 차선의 방법을 채택할 수 있습니다.


  1) 워드프로세서의 템플릿 기능을 이용한 원고 작성


  본 지침에 의하면 『디지털 성남 문화 대전』을 구성할 15개 유형의 항목들이 모두 일정한 양식에 따라 작성되도록 되어 있으므로, 저작물의 내용에 대한 구조화 작업이 상당 부분 이루어져 있다고 할 수 있습니다. 추가로 고려할 사항은 각 항목의 구성 요소를 전산 시스템이 기계적으로 추출하는 데 큰 어려움이 없도록 하는 것입니다.

  집필자들에게 나누어 줄 양식 파일을 일반 문서 파일로 만들지 않고, 구성 요소를 기계적으로 인식할 수 있는 템플릿(template, 型板) 파일로 제공하여 집필자들이 그 틀 안에 정보를 넣게 하면 ‘생년’, ‘몰년’, ‘본관’, ‘초명’ 등이 요소별로 인식될 수 있기 때문에 XML 파일 등 구조적인 정보 데이터로 쉽게 전환할 수 있습니다.


  2) 본문 원고 콘텐트의 구조화 방안


  현재의 편찬 지침은 각 항목 원고 내용을 “정형 데이터”(항목명, 주제어 등)와 “비정형 데이터”(본문 원고)로 구분하고 있습니다. 이중 전자는 위에서 언급한 템플릿 기능 활용으로 처리할 수 있지만, 본문 속에 담긴 내용 요소들은 이 방법으로 구조화하기 어렵기 때문에 마크업(Mark-Up) 기호를 활용한 구조화 방안을 강구할 필요가 있습니다. (※ 이 제안의 필요성에 대해서는 연구원 측에서 추가로 논의하시기 바랍니다. )

  정보 콘텐트의 제작 단계에서부터 그 구성 요소가 명시적으로 드러날 수 있게 하는 것이 XML과 같은 구조적 데이터 형식을 도입하는 이유입니다. 이러한 사전 작업이 이루어지면, 정보 서비스 단계에서 모든 유관 정보가 상호 연계성을 가지고 제공될 수 있을 뿐 아니라, 지능적인 검색 서비스를 수행할 수 있는 장점이 있습니다.

 『디지털 성남 문화 대전』의 본문 원고를 XML 문서로 작성토록 할 경우, 이를 위한 DTD 또는 Schema는 콘텐트 성격에 대한 보다 전문적인 분석 및 작업의 난이도 등을 충분히 고려하여 작성되어야 합니다. 여기서는 간단한 예시만을 보이도록 하겠습니다.


예시 1. 인물

 

<항목>

<항목명 유형=“인물”>이극배(李克培)</항목명>

<메타 데이터>

    .......  ※ 다른 정형 데이터는 템플릿 입력 데이터에서 자동 변환

</메타 데이터>

<본문>

<섹션 표제=“정의”><연대>1422(세종 4)</연대>~<연대>1495(연산군 1)</연대>. <연대>조선 전기</연대>의 문신.</섹션>

<섹션 표제=“가계”>본관은 <지명>광주(廣州)</지명>이다. 자는 <인명 유형=“자” 식별자=“이극배|李克培@1422”>겸보(謙甫)</인명>이다. 호는 <인명 유형=“호” 식별자=“이극배|李克培@1422”>우봉(牛峰)</인명>이다. <인명 유형=“명” 식별자=“이집|李集@????”>집(集)</인명>의 증손이며, 할아버지는 <인명 유형=“명” 식별자=“이지직|李之直@????”>지직(之直)</인명>이다. 아버지는 우의정 <인명 유형=“명” 식별자=“이인손|李仁孫@????”>인손(仁孫)</인명>이며, 어머니는 <인명 유형=“성명” 식별자=“노신|盧信@????”>노신(盧信)</인명>의 딸이다.</섹션>

<섹션 표제=“활동사항”><연대>1447년(세종 29)</연대> <용어>사마시</용어>에 합격해 진사가 되었다. 그 해 <용어>식년문과</용어>에 <용어>정과</용어>로 급제하였다. 처음에 승문원부정자로 보임되었다. 이어 감찰이 되었으며, 검찰관으로 <지명>명나라</지명>에 다녀왔다. 그 뒤 정언․지제교가 되었다. 얼마 뒤에 지난번 <지명>명나라</지명>에 갔을 때 검찰직을 잘 수행한 것으로 평가되어 병조 겸 <용어>좌랑</용어>이 되었다가 <용어>정랑</용어>으로 승진하였다. <P/>

    <인명 유형=“묘호” 식별자=“세조|世祖@조선”>세조</인명>가 즉위하는 데 공이 인정되어 <용어>좌익공신(佐翼功臣)</용어> 3등에 녹훈되었다. <연대>1457년(세조 3)</연대>에는 예조 <용어>참의</용어> 겸 <용어>경상도관찰사</용어>에 임명되었다. 이어 <용어>가선대부(嘉善大夫)</용어>에 승자되어 <인명 유형=작호 식별자=“이극배|李克培@1422”>광릉군(廣陵君)</인명>에 봉해졌다.</섹션>

    ......

</섹션>

    ......

    ......

<섹션 표제=“참고문헌”><서명>世宗實錄</서명>, <서명>世祖實錄</서명>, <서명>成宗實錄</서명>, <서명>燕山君日記</서명>, <서명>國朝榜目</서명>, <서명>燃藜室記述</서명>.</섹션>

</본문>

</항목>



예시 2. 지명


<항목>

<항목명 유형=“지명”>성남모란시장 城南牡丹市場</항목명>

<메타 데이터>

    .......  ※ 다른 정형 데이터는 템플릿 입력 데이터에서 자동 변환

</메타 데이터>

<본문>

<섹션 표제=“정의”><지명>경기도</지명> <지명>성남시</지명> <지명>수정구</지명> <지명>수진동</지명>에 있는 시장.</섹션>

<섹션 표제=“개장경위”>면적 2,143.7㎡, 매장면적 277.05㎡이다. 매장 수는 약100여 개이며, 매월 4일․9일․14일․19일․24일․29일에 시장이 열린다. <P/>

   1970년 초부터 서울의 도시 재개발로 인구가 이곳으로 모여들어 <관련항목 유형=“지명”>수진교</관련항목>와 <관련항목 유형=“지명”>대원천</관련 항목>에 이르는 길가에 장이 형성되기 시작하여 <연대>1974년</연대>에 본격적으로 개장되었다.<P/>

   본래 <지명>서울</지명>의 동남쪽 <지명>가락동</지명>과 <지명>성남시</지명>․<지명>경기도</지명> 일원의 농촌 주민들이 농산물, 특히 토산품이나 특산물을 내어다 팔면서 그것을 수집하고 산매하는 상인들이 모여들어 상거래가 이루어졌으며, 도시화의 진전과 함께 급속히 성장하여 점차 큰 노점시장을 형성시켰다.<P/>

   그리고 <연대>1970년대 후반</연대>부터 산업화의 영향으로 상업농업이 시작되면서 출하되는 산물이 지역성을 반영, 특종상품시장으로 변모하기 시작하였다.<P/>

</섹션>

    .....

    .....

</본문>

</항목>


※ 요소(element) 및 속성(attribute) 설명

<항목>, <본문>, <섹션> ...... 집필 원고의 계층적 체계를 표시

         표제: 본문 중의 소표제

<항목명> 항목의 명칭

         유형: 15개 유형 중 어느 것에 속하는가를 표시

<인명> 인명을 표시

         유형: 본문에 쓰인 인명의 형식 유형 ..... 성명, 성, 명, 자, 호, 시호, 묘호, 봉작호 등

         식별자: 인명 DB 데이터의 정확한 연결을 위한 고유 명칭

<지명> 지명을 표시

<서명> 도서명을 표시

<연대> 연대, 시대를 나타내는 부분임을 표시

<관련항목> 『디지털 성남 문화 대전』내의 관련 항목 링크

         유형: 관련 항목의 유형

<용어> 용어 사전 역할을 할 다른 데이터베이스의 해당 항목 링크

<P> 문단을 표시


※ 본문 원고에 XML을 적용할 경우, 편찬 지침의 “문장 및 표기 관련 사항”에 기술한 내용의 많은 부분이  XML 형식으로 표현될 수 있습니다.



  2. 전산 자원 “참고 문헌”의 기술 지침 제정 필요


 『디지털 성남 문화 대전』의 편찬 과정에서 책자형 참고 문헌뿐 아니라 인터넷을 통해 제공되고 있는 디지털 자원도 참고 자료로 활용될 가능성이 많다고 생각됩니다. (예를 들어 국가 및 시군구 지정 문화재에 대해서는 문화재청의 웹 데이터베이스에서 손쉽게 풍부한 정보를 획득할 수 있습니다.) 이러한 정보 소스를 정확히 밝히는 것은 정보 서비스 차원 뿐 아니라, 향후에 콘텐트 보완 작업을 할 때에도 크게 도움이 될 것입니다. 인터넷 정보 자원을 “참고 자원”으로 표시하는 방법에 대한 지침이 마련되어야 하며, 아울러 문헌 형태의 참고자료도 그것의 전자 원문이  있을 경우 바로 연결될 수 있도록 하는 링크 정보의 기술 방안이 제시되어야 할 것입니다.